home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / doc / www-talk.archive.Z / www-talk.archive / text0003.txt < prev    next >
Encoding:
Text File  |  1992-11-30  |  4.2 KB  |  100 lines

  1. Dan,
  2.  
  3. > I've made some tangible progress on the X11 browser, so I though 
  4.  
  5. > I'd let you know.
  6. > ...
  7. > This code is not in any shape to distribute, or even show anybody.
  8. > But it works, and it's pretty speedy. That's enough to encourage me  
  9. > to polish it off.
  10.  
  11. Sounds like great progress! The TCL sounds interesting -- where did  
  12. you get it? 
  13.  
  14.  
  15. > [If you wan't my stuff, you'll have to be C++ capable. I can't
  16. > think in C any more. :-]
  17.  
  18. Don't worry - we can handle C++, although for the line mode browser  
  19. we wanted portability into places where C++ could not reach. That's  
  20. why the common code (in WWW/Implementation) is all in C. Believe me,  
  21. after writing the NeXT browser in Objective-C it was a wrench to  
  22. conclude that it would have to be deobjectified.
  23.  
  24. > If you could round up some info on exactly what I can expect to see  
  25. > in an HTML file, and some idea of how you want it formatted [I have  
  26. > the HTML doc and the LineMode browser, but if you've got time to
  27. > give me a little more info...] I'll be ready to tackle that pretty  
  28. > soon.
  29.  
  30. You ask for info on exactly what you can expect to find in an HTML  
  31. file, but you've read the two HTML files about HTML.  What is missing  
  32. from there?
  33.  
  34. Here is some discussion about the tags -- where it's not in  
  35. http://info.cern.ch/hypertext/WWW/MarkUp/Tags.html I have updated  
  36. that document now.
  37.  
  38. Most of the tags are just style tags: this goes for the headings H1  
  39. to H6, the lists UL and OL with list elements LI, the glossary DL  
  40. with elements DT and DD.
  41.  
  42. <TITLE> ..<TITLE> is designed to be used for putting in the top  
  43. banner of a window, or using as the window  name. It also is what you  
  44. would use in a history list. It shouldn't be displayed in the text  
  45. itself, as usually there is a <H1> heading atteh top of the text  
  46. anyway. A difference is that thet title is designed to make sense out  
  47. of context, whereas the heading is within context. For example,
  48. a title might be "Formatting Characters for Printf -- C reference  
  49. manual" whereas the heading may just be "Formatting characters".
  50.  
  51. The base address tag is not used, nor is highlighting HP1 etc.
  52.  
  53. Anchors are used!  The REL attribute is NOT used.
  54.  
  55. <ISINDEX> is sent by servers to indicate that they will accept a  
  56. search given this document name plus keywords. It turns on a search  
  57. panel when the document is the main window.  An even better  
  58. implementation would have a keyword field at the bottom of the text  
  59. window if the document is a searchable index.  That would make the  
  60. document more self-contained as an item in the user's eyes, and  
  61. reduce screen clutter.
  62.  
  63. <NEXTID> can be ignored by browsers, only needed for editors.
  64.  
  65. <XMP> and <LISTING> are used to indicate inserted literal text.
  66. To make life easier for those writing documents (and because we don't  
  67. have entities in the code yet) they are special in that EVERYTHING is  
  68. litteral text until the closing tag - so one can use XMP for giving
  69. examples of HTML for example.  (We really need an escaping method -  
  70. the next parser will have simpl entities like "<." for "<".)
  71. Within XMP or LISTING, newlines are significant (and mean "new  
  72. line"!)
  73.  
  74. <PLAINTEXT> is used to indicate that the rest of the file is in fact
  75. just ASCII. It turns off SGML parsing completely. It's a fudge for
  76. the moment, until we have the document format negociation.
  77. ______________________________________
  78.  
  79.     Structure of documents:
  80.  
  81. In writing a new generic parser, I wondered whether your text object  
  82. will store the nested structure of a document. At the moment, the  
  83. document is a linear sequence of styles: you can't have lists within  
  84. lists, etc. Ideally, it would be able to handle this - although its  
  85. more difficult for a human writer to handle when formatting the  
  86. document. I would in fact prefer, instead of <H1>, <H2> etc for  
  87. headings [those come from the AAP DTD] to have a nestable  
  88. <SECTION>..</SECTION> element, and a generic <H>..</H> which at any  
  89. level within the sections would produce the required level of  
  90. heading.
  91.  
  92. For a browser, it is quite satisfactory to flatten the structure back  
  93. into a sequence of styles, but for an editor it isn't. Are you going  
  94. to go for editing capability?
  95.  
  96. Tim
  97.  
  98. PS: Shall I put you on the www-talk list?
  99.  
  100.